#RTX GPU
牙膏踩爆!RTX 6090可能會有2.9萬個CUDA核心 但還得漲價
NVIDIA前兩天發佈了Rubin CPX,這是一款針對AI推理而生的GPU,沒用昂貴的HBM,而是給了128GB GDDR7視訊記憶體。這款CPX顯示卡對遊戲玩家而言也不是沒意義的,因為它很可能是未來的RTX 6090顯示卡基礎,網友High Yield稱CPX顯示卡沒有像其他AI專用卡那樣閹割了光柵單元,而是保留了下來。考慮到NVIDIA在復用GPU上刀法精妙,這意味著CPX所用的GPU核心未來也是Rubin家族遊戲卡的核心,即便規格不完全一樣,但也會非常相似。具體來說的,RTX 6090顯示卡所用的核心可能是GR202,SM單元數量從當前的170組提升到224組,CUDA核心來到了28672個,將近2.9萬核心了,也是史無前例的。這將使其FP32性能從RTX 5090的104.77TFLOPS提升到143.36TFLOPS,大約提升30%以上,這還沒考慮到架構上的提升。視訊記憶體規格方面可能變化不大,畢竟RTX 5090已經做到了32GB 512bit,NVIDIA也不太可能良心到一下子給64GB視訊記憶體,不過受益於GDDR7頻率提升,頻寬從1.8TB/s提升到1.92TB/s,聊勝於無吧。以上是對RTX 6090顯示卡的推測,個人覺得算是挺靠譜的,但是最終如何還得看NVIDIA在那裡下刀,整體性能提升30%也符合這兩年來的發展軌跡。不過伴隨著RTX 6090規格的提升,下代顯示卡又來一波漲價也是可以預期的,畢竟Rubin會使用台積電3nm工藝,比當前RTX 5090的4N(本質還是5nm改進)工藝貴不少,再加上其他改進,性能與價格漲幅估計也是正相關的。奇怪的是,RTX 5090/5080 FE公版開始消失了。NVIDIA Founders Edition是很多玩家心目中的信仰所在,但公版卡起的是一個帶頭作用,理論上不應該和AIC廠商搶生意,AMD的公版卡就幾乎不怎麼賣,NVIDIA這邊的公版卡壽命已經夠長了。最近在歐美市場,RTX 5090、RTX 5080的公版卡開始悄無聲息地消失,NVIDIA官網紛紛下架了,美國、法國、德國、英國等主要國家均是如此。比如在德國,NVIDIA官網上已經看不到RTX 5090 FE,而在英國和美國,RTX 5090、RTX 5080 FE都被移除了,最高只有RTX 5070。目前還不清楚這是臨時調整,抑或NVIDIA已經停產。NVIDIA德國的一位發言人在接受採訪時只是說,不清楚。NVIDIA中國官網上,RTX 5090 FE自然是沒有的,RTX 5080 FE倒是依然在列,可以跳轉到京東、天貓旗艦店,而價格一直堅持8299元不動搖。英國德國法國美國另外,SK海力士官方宣佈,全球第一家完成了新一代HBM4記憶體的研發,並且已經做好了大規模量產的準備。SK海力士HBM4記憶體的I/O介面位寬為2048-bit,每個針腳頻寬10Gbps,因此單獨一顆的頻寬就可高達驚人的2.5TB/s。這已經超過了JEDEC標準規範中規定的8Gbps,SK海力士宣稱在AI裝置中部署後可帶來最多69%的性能提升。SK海力士還使用了該公司自研的MR-MUF封裝技術,1bnm工藝也就是第五代10nm級。至於satck堆疊層數、單顆容量,SK海力士暫未披露,預計最高12堆疊。另外,三星也在積極推進HBM4,希望能和SK海力士搶一杯羹。HBM4記憶體對於下一代AI基礎設施至關重要,NVIDIA、AMD、Intel都離不開它。其中,NVIDIA Rubin預計搭載288GB HBM4,AMD Instinct MI400系列更是最高做到恐怖的432GB,頻寬19.6TB/s。除了遊戲卡市場,AMD還在AI顯示卡市場追趕NVIDIA的步伐,這個領域要比遊戲市場更難,甚至很難靠性價比優勢賣出銷量。AMD近期多位高管的表態都在強調2026年的MI450系列AI顯示卡將會給AMD帶來重磅收入,而且性能等方面全面超越對手產品。但是今年的AI市場上,AMD主打的MI350系列可能就沒那麼受歡迎了,HSBC匯豐銀行日前發佈的報告中,將AMD的目標價從200美元下調到了185美元。下調的原因就是MI355顯示卡的均價從25000美元降至23000美元,約合人民幣16.4萬元。該系列顯示卡是今年初才發佈的,3nm工藝,CDNA4架構,其中MI350X適用於風冷,MI355X適用於液冷,兩者的規格差不多,都是288GB HBM3e視訊記憶體,8TB/s頻寬,後者的性能更高一些。MI355X的FP64性能可達78.6TFLOPS,FP16、FP8及FP4性能則是5、10.1、20.1PFLOPS。這樣規格的顯示卡平均售價只要16萬元出頭,這是什麼概念呢?NVIDIA基於RTX 4090改進的國內特供顯示卡H20,也就96GB HBM3記憶體,之前國內售價都超過了20萬元,被哄搶的時候甚至更高。在AMD PPT中性能比B200還要強的MI350系列顯示卡,還要得打價格戰,這也能說明NVIDIA在AI市場護城河有多深,不單是AMD硬體性能領先就能比的。不過匯豐也在報告中表示,儘管下調了目標股價,但AMD在AI市場上的前景還是不錯的,明年預期收入也只是從151億調至139億美元,仍比預期高20%,華爾街低估了AMD的AI業務。包括微軟、甲骨文、Meta在內的雲服務廠商也在加強與AMD的合作,測試他們的MI400系列機櫃解決方案,這是AMD明年在AI市場翻身的殺手鐧級產品。 (硬體世界)
The Information:輝達H20,清完庫存為止?輝達重啟生產面臨障礙
根據《The Information》周六(19 日)報導,美國晶片巨頭輝達( NVDA-US ) 已告知中國客戶,其H20 人工智慧(AI)晶片供應量有限。 H20 為目前美國允許輝達對中國出口的最高階AI 晶片。報導引述兩位知情人士指出,美國政府於4 月下令禁止H20 晶片出口至中國,使輝達被迫取消原先的客戶訂單,並撤銷在晶片代工大廠台積電( 2330-TW ) 的製造產能預約。輝達執行長黃仁勳於北京一場媒體活動上表示,台積電已將原定的H20 生產線轉為供應其他客戶的晶片產品。若從零開始重新製造H20 晶片,可能需要耗時九個月。報導指出,輝達目前並未計畫恢復H20 晶片生產,但沒有引用任何消息來源或提供細節。輝達也拒絕對該報導發表評論。儘管遭遇禁令與產能問題,黃仁勳近期仍釋出樂觀訊號,表示輝達將加速H20 晶片供應,並對美國政府核發對中出口許可一事持正面態度,預計相關申請將能順利獲批。輝達本周正式表示,將恢復向中國銷售H20 晶片,但依據現行美國出口政策,仍需事前取得授權許可。此外,為強化對中國市場的佈局,輝達也宣佈正在開發一款新晶片RTX Pro GPU,該產品將完全符合美國對中國的出口規範。路透社隨後引述兩名知情人士稱,中國多家企業正加緊提交訂單。輝達收到訂單後,需將其提交美國政府審批,目前字節跳動和騰訊正準備提交申請。知情人士透露,輝達已建立一個“白名單”系統,讓有意購買的中國企業登記,此舉是申請流程中的關鍵環節。不過,字節跳動不具名負責人星期三(16日)向第一財經表示,目前並未提出購買申請,有關報導不精準。眾議院特別委員會的共和黨籍主席穆勒納爾星期五(19日)致函美國商務部長盧特尼克說:“商務部此前禁止輸出H20的決定是正確的,我們不能讓CN使用美國晶片訓練AI模型,強化它的軍事能力、以及削弱美國的創新力。” (invest wallstreet)
輝達家用級“超級電腦”內建RTX 5070級顯示卡,能打遊戲嗎?
在台北電腦展上,輝達介紹了家用級“超級電腦”DGX Spark 的最新消息。此前,在三月份的 GTC 活動中,輝達正式發佈了為AI愛好者和家庭開發者打造的迷你桌上型電腦DGX Spark,但沒透露內部GPU的詳細規格。現在,我們知道,這款超級電腦搭載的處理器在技術上與RTX 5070十分類似。GPU內部細節曝光據Videocardz報導,DGX Spark內部改採用的GB10晶片擁有6144個CUDA核心,與RTX 5070一致。然而,儘管兩款GPU都基於輝達的Blackwell架構,但GB10不是用來打遊戲的,所以,視訊記憶體頻寬僅有273GB/s,相較於RTX 5070的672 GB/s顯得遜色許多。統一記憶體架構與能效表現與傳統的獨立視訊記憶體設計不同,DGX Spark 配備了128 GB的LPDDR5x統一記憶體,這套記憶體不僅供給Blackwell GPU使用,同時也為Grace CPU 提供運算支援。相比之下,RTX 5070僅搭載了12 GB的GDDR7視訊記憶體。這一記憶體配置對於 AI訓練和大規模資料處理來說,非常有用。此外,一位對微星提出疑問的網友透露,這款超級電腦的GPU 功耗上限為224 W,而RTX 5070 的TGP為300 W,這表明GB10的運行頻率可能被適當壓低以控制功耗。輝達方面表示,GB10在峰值性能又1000 AI TOPS,而RTX 5070則為 988 TOPS。雖然這兩個數字可能只是理論值,但也顯示出DGX Spark在 AI運算方面的強大潛力。定位與市場前景儘管DGX Spark採用了與RTX 5070類似的GPU,一般使用者沒法拿它打遊戲。畢竟,該裝置運行的是定製的輝達作業系統,主要面向AI演算法開發與訓練市場。不過,這也給駭客和改裝愛好者留下了無限遐想:或許不久的將來,會有技術極客嘗試將這台超級電腦改造成一款迷你遊戲主機。目前,關於 DGX Spark的定價尚無明確公開資訊,但早前預訂價約為 4000美元。對於那些熱衷於AI訓練,並希望以較低成本建構類似性能配置的使用者來說,128 GB的統一記憶體無疑提供了難以抗拒的吸引力,因為組建一台配置相似的自研系統所需的成本可能更高。 (科技巴圖魯)
輝達RTX Pro 6000 Blackwell GPU發佈:性能與記憶體大幅提升!
輝達新一代工作站GPU——RTX Pro 6000 Blackwell的規格近日曝光,顯示出其在性能和記憶體容量上的顯著提升。根據LeadTek網站的洩露資訊以及NBD貨運記錄,RTX Pro 6000 Blackwell GPU擁有24,064個CUDA核心,配備96GB GDDR7視訊記憶體,功耗為600W,相比前代RTX 5090 GPU,CUDA核心數量增加了11%。 此次曝光的RTX Pro 6000 Blackwell GPU是輝達在RTX 6000 Ada發佈兩年多後的下一代產品。從命名上看,輝達為下一代工作站卡引入了新的“Pro”標籤,旗艦產品仍屬於“RTX 6000”系列,但增加了“X”識別碼。儘管輝達的工作站產品命名法一直不夠統一,但此次的“Pro”標籤似乎暗示了更高的性能定位。 根據洩露的規格資訊,RTX Pro 6000 Blackwell系列包括兩個版本:RTX Pro 6000 X Blackwell和RTX Pro 6000 Blackwell。兩款GPU均配備96GB GDDR7視訊記憶體,採用512位記憶體介面,視訊記憶體由多個24Gb(3GB)晶片組成,兩個晶片共享一個32位記憶體控製器。非“X”版本的RTX Pro 6000 Blackwell擁有188個流處理器(SM),相當於24,064個CUDA核心,佔GB202晶片的97.9%。而主銷的RTX Pro 6000 X Blackwell則採用GB202-870晶片,預計將啟用所有192個SM。 RTX Pro 6000 Blackwell的功耗為600W,是RTX 6000 Ada所需功耗的兩倍多,但可以通過一根12V-2x6電源線滿足供電需求。這一高功耗設計表明,該GPU旨在滿足專業應用的高性能需求,尤其是在人工智慧訓練和推理、遊戲開發、內容創作、專業可視化(ProViz)和電腦輔助設計(CAD)等領域。儘管96GB的視訊記憶體容量對於大多數遊戲場景而言可能過剩,但在上述專業應用中,大容量視訊記憶體將提供顯著優勢。